假设我们希望比较两个不同总体的平均值。如下图每个总体都有一个均值和一个标准差。
我们的目标是利用样本中的信息来估计两个总体均值的差异μ1−μ2,并就此作出统计上有效的推论。
下面直接给出置信度为100(1−α)%的两个独立总体均值差值的置信区间: [¯x1−¯x2−zα/2√s21n1+s22n2,¯x1−¯x2+zα/2√s21n1+s22n2]
(这里要求样品必须是独立的,且每个样品必须大:n1≥30,n2≥30。)
关于两个总体平均值相对大小的假设,使用与在单个总体中使用的相同的临界值和p值程序进行检验。所需要做的就是知道如何表达原假设和备选假设,以及标准化检验统计量的公式及其分布。 原假设和备择假设总是用两种总体均值的差值来表示。原假设:
H0=μ1−μ2=D0备选假设可以采取三种形式之一 Ha=μ1−μ2<D0 Ha=μ1−μ2>D0 Ha=μ1−μ2≠D0
只要样本是独立的且两者都很大,则标准化检验统计量的以下公式是有效的,并且它具有标准正态分布。(当总体标准差σ1和σ2都已知的情况比较少见时,就用样本标准差s1和s2代替。)
检验统计量服从标准正态分布。
为了比较两家相互竞争的有线电视公司的客户满意度水平,随机选择公司1的174名客户和公司2的355名客户,并被要求在一个五分制的量表上给他们的有线电视公司打分,1分最不满意,5分最满意。调查结果汇总如下表:
公司 1 | 公司 2 |
---|---|
n1=174 | n2=355 |
¯x1=3.51 | ¯x2=3.24 |
s1=0.51 | s2=0.52 |